یک الگوریتم مبتنی بر گراف برای خلاصه سازی متون

پایان نامه
چکیده

سیستم های خلاصه برداری از متن، یافتن اطلاعات مورد نیاز را از میان خیل عظیم اطلاعاتی که در قالب متن هستند، تسریع می کنند. این سیستم ها از روش های مختلفی برای انتخاب مهم ترین موضوعات متن استفاده می کنند. یکی از روش هایی که در این زمینه به صورت گسترده مورد استفاده قرار می گیرد، استفاده از ساختار گراف و ویژگی های آن برای انتخاب مهم ترین جملات متن است. الگوریتم ارائه شده در این تحقیق، سعی در خلاصه سازی متون فارسی با استفاده از ساختار گراف و ساختن مسیر بر اساس آن دارد. الگوریتم پیشنهادی، متن ورودی را به صورت گراف نمایش داده و با استفاده از ویژگی های ساختار گراف، روش های آماری، ویژگی های ساختاری متن و استفاده از مسیرها، مهم ترین و پر محتواترین جملات متن را انتخاب می کند. نوآوری این الگوریتم در مقایسه با کارهای پیشین، استفاده از مسیرها و بررسی میزان اهمیت ارتباط موجود بین جملات، به منظور حفظ هر چه بیشتر انسجام و جریان موضوعی متن است. برای ارزیابی کیفیت خلاصه تولیدی، میزان شباهت آن با خلاصه انسانی مورد بررسی قرار گرفته است. نتایج بررسی ها نشان می دهد که الگوریتم ارائه شده در مقایسه با کارهای پیشین مطرح شده در زمینه خلاصه سازی متون فارسی، خلاصه ای با شباهت بیشتر به خلاصه انسانی تولید می کند.

منابع مشابه

معرفی الگوریتم خلاصه سازی معناگرای sigs برای گراف های عظیم الجثه

امروزه گراف ها به طور گسترده در بسیاری از حوزه ها از جمله نرم افزار، شبکه، وب، شیمی، زیست، ژنتیک و حتی مخابرات و جامعه شناسی برای مدل سازی و پردازش داده ها استفاده می شوند. حجیم بودن و پیچیدگی زیاد گراف های داده، یکی از مهم ترین چالش ها در این زمینه است که کار استخراج اطلاعات و دانش مورد نیاز از میان مجموعه ای از داده ها را بسیار مشکل می سازد. در چنین شرایطی، استفاده از الگوریتم های خلاصه سازی ...

متن کامل

بهبود خلاصه سازی خودکار متون فارسی با استفاده از روش‌های پردازش زبان طبیعی و گراف شباهت

A significant amount of available information is stored in textual databases which contains a large collection of documents from different sources (such as news, articles, books, emails and web pages). The increasing visibility and importance of this class of information motivates us to work on having better automatic evaluation tools for textual resources. The automatic summarization of tex...

متن کامل

یک الگوریتم ابتکاری برای تجدید آرایش شبکه‌های توزیع به منظور کاهش تلفات اهمی مبتنی بر نظریه‌ی گراف

One of the ways of reducing active power losses in the distribution networks is using the network reconfiguration for different load levels. Since the number of possible configuration of a distribution network is usually very much and then review of all of them (especially in the network of large-scale) to finding the optimal configuration is not possible simply, therefore in this paper a new a...

متن کامل

خلاصه سازی خودکار متون فارسی مبتنی بر هستی شناسی

با توجه به گسترش روزافزون اطلاعات در دسترس از طریق اینترنت، لزوم استفاده از روش های خلاصه سازی خودکار متن، بیش از پیش احساس می شود. روش هایی که با استخراج مهمترین مطالب موجود در اسناد مانع از مطالعه کامل حجم انبوه از آنها شوند. خلاصه سازی عبارت است از فشرده سازی متن (متون) منبع و تولید یک نسخه کوتاه تر از آن به نحوی که محتوای اطلاعاتی آن حفظ شود. اغلب سیستم های خلاصه ساز با استفاده از روش های س...

15 صفحه اول

یک الگوریتم ابتکاری برای تجدید آرایش شبکه های توزیع به منظور کاهش تلفات اهمی مبتنی بر نظریه ی گراف

یکی از راهکارهای کاهش تلفات در شبکه​های توزیع استفاده از تجدید آرایش فیدرهای فشار متوسط متناسب با سطوح بار مختلف سیستم است. تعداد آرایش​های ممکن یک شبکه­ی توزیع بسیار زیاد است و امکان بررسی تمام آرایش​ها (مخصوصاً در شبکه​های با مقیاس بزرگ) برای یافتن آرایش بهینه به راحتی میسر نیست. در این مقاله یک الگوریتم جدید مبتنی بر نظریه­ی گراف و الگوریتم­های توسعه یافته­ی آن برای تجدید آرایش شبکه​های توزیع...

متن کامل

ارائه یک سیستم هوشمند و معناگرا برای ارزیابی سیستم های خلاصه ساز متون

Nowadays summarizers and machine translators have attracted much attention to themselves, and many activities on making such tools have been done around the world. For Farsi like the other languages there have been efforts in this field. So evaluating such tools has a great importance. Human evaluations of machine summarization are extensive but expensive. Human evaluations can take months to f...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه پیام نور - دانشگاه پیام نور استان تهران - پژوهشکده اقلیم شناسی

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023